User Avatar
求职中 / 可接项目

钟权捷

深度学习算法工程师/机器学习算法工程师

福建省厦门市
zhongqj@stu.xmu.edu.cn

关于我

核心技能

Python 90%
NumPy 90%
Pandas 90%
Scikit-learn 90%
Git 85%
Docker 85%
TensorBoard 85%
OpenCV 85%

特长与爱好

学术研究 (CCF-A论文撰写与投稿经验)开源项目贡献 (Hugging Face社区模型优化)技术博客写作算法竞赛 (Kaggle, 天池竞赛)阅读学术论文羽毛球健身

职业生涯

深度学习算法实习生

字节跳动 火山引擎

2024.01 — 2024.06
  • 参与长序列多模态大模型(文本 + 语音)微调项目,基于 Mamba-Merge 算法优化模型长文本理解能力
  • 设计动态序列分段策略,解决长文本(5120token)建模时的显存溢出问题,显存占用降低 35%
  • 负责模型性能评估与调优,在公开数据集 GLUE、VoxCeleb 上完成测试,文本理解准确率提升 3.2%
  • 参与专利申请1项《一种基于稀疏融合的长序列多模态建模方法》(申请号:202410342795)
  • 工具与技术:PyTorch、Hugging Face Transformers、TensorRT、Docker、Git

教育背景

2021.09-2024.06

厦门大学

硕士 • 人工智能

2017.09-2021.06

厦门大学

学士 • 计算机技术

科研经历

联邦学习异构场景优化研究

研究员 @ 厦门大学

2022.09 — 2024.03
  • 针对联邦学习中客户端设备异构、数据分布不平衡导致的模型性能下降问题,提出自适应层聚合策略 FedAdapt
  • 设计动态权重分配机制,基于客户端局部训练效果调整各网络层的聚合权重,平衡全局一致性与局部适配性
  • 基于PyTorch 实现算法原型,在 CIFAR-10、MNIST 及真实医疗数据集上验证,对比 FedAvg/FedProx 等算法,模型准确率提升 7.2%-11.5%,通信开销降低 28%
  • 核心创新:首次将层粒度自适应聚合与客户端异质性量化结合,解决异构场景下的模型泛化难题

长序列多模态建模研究

研究员 @ 厦门大学

2022.01 — 2023.06
  • 针对传统 Transformer 在长序列多模态数据(文本+图像序列)中显存占用高、推理慢的问题,结合 Mamba 架构设计稀疏状态融合模块
  • 提出跨模态注意力剪枝策略,过滤冗余交互信息,在保证语义完整性的前提下提升计算效率
  • 基于 Hugging Face Transformers 框架构建预训练模型,在 VideoQA、ImageCaption 等任务上,推理速度提升 40%,显存占用降低 52%,准确率持平 SOTA 模型
  • 核心创新:稀疏状态融合机制+跨模态剪枝,实现长序列多模态建模的效率 - 性能平衡

发表论文

FedAdapt: Adaptive Layer-wise Model Aggregation for Heterogeneous Federated Learning

1st Author 2024

NeurIPS 2024 (CCF-A 类会议,EI/CPCI 检索)

Mamba-Merge: Efficient Long-sequence Modeling via Sparse State Fusion for Vision-Language Pre-training

2nd Author 2023

CVPR 2023 (CCF-A 类会议,EI/CPCI 检索)

精选项目

基于联邦学习的个性化推荐系统

核心算法开发者(负责联邦推荐框架设计与实现)
项目背景:解决校园二手交易平台用户数据隐私保护与个性化推荐需求的矛盾
基于自研 FedAdapt 算法,搭建联邦推荐系统架构,客户端本地化训练用户偏好模型,仅上传层聚合参数
结合协同过滤与深度学习,设计双塔推荐模型,用户塔采用 MLP,物品塔引入 CNN 提取商品图像特征
使用 Docker 容器化部署客户端节点,基于 Flask 搭建联邦参数服务器,支持 100+ 并发客户端接入
推荐点击率提升 8.7%,用户留存率提升12%,未发生数据隐私泄露事件
系统延迟控制在200ms 内,支持每日10万+用户行为数据的增量训练
获厦门大学"人工智能创新大赛"校级一等奖
FedAdaptMLPCNNDockerFlask

工业缺陷检测与分类系统

角色:算法工程师(负责目标检测模型优化)
项目背景:为某电子厂提供 PCB 板表面缺陷自动检测方案,替代人工检测
基于 YOLOv8 改进,引入注意力机制(CBAM)与特征金字塔增强模块,提升小缺陷检测精度
采用迁移学习,在公开缺陷数据集 PCB100 上预训练,结合企业私有数据集(5万+图像)微调
使用 TensorRT 进行模型量化与加速,部署于边缘计算设备(NVIDIA Jetson Xavier)
缺陷检测准确率达99.3%,召回率 98.7%,单张图像检测时间≤30ms
降低企业检测成本 60%,已投入小批量生产使用
YOLOv8CBAMTensorRTNVIDIA Jetson Xavier